\include{defines}

\chapter{Grundlagen der Statistik}

\section{Begriffe}
$x_1,x_2, \ldots, x_n$ Realisationen $X_1, \ldots, X_n$ unabhängig, identisch wie $X$ verteilt\\
$(X,F)$ Grundgesamtheit\\
$X$ Zufallsvariable, Merkmal\\
$F$ Verteilungsfunktion\\
$(X_1, \ldots, X_n)$ Stichprobe vom Umfang $n$\\
$(x_1, \ldots, x_n)$ konkrete Stichprobe\\
$Y=g(X_1, \ldots, X_n)$ Stichprobenfunktion

\section{Beschreibende Statistik}

\section{Mathematische Statistik}

\section{Schätzverfahren}
\subsection{Konfidenzintervalle}
\subsubsection{$\mu$ unbekannt, $\sigma$ bekannt}
$P\left(\left|\dfrac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\right|\leq c_{1-\frac{\alpha}{2}}\right)=1-\alpha$\\[0.2em]
\begin{empheq}[box=\mycolorbox]{align} 
\textnormal{Konfidenzintervall\hspace{0.5cm}} \mu=\bar{x}\pm\varepsilon_n\cdot c_{1-\frac{\alpha}{2}}\\
\varepsilon_n=\dfrac{\sigma}{\sqrt{n}}\notag
\end{empheq}
enthält mit der Irrtumswahrscheinlichkeit $\alpha$ den Parameter $\mu$
\subsubsection{Konfidenzintervall für $\mu$ bei unbekanntem $\sigma$}
$P(|T|\leq t)=1-\alpha$\\
$T=\sqrt{n}\cdot\dfrac{\bar{X}-\mu}{S}$\hspace{1.5cm} $S^2=\frac{1}{n-1}\sum\limits_{i=1}^n(X_i-\bar{X})^2$ $\rightarrow$ mit TR berechnen\\
$t=t_{n-1,1-\frac{\alpha}{2}}$\\
\begin{empheq}[box=\mycolorbox]{align}
\textnormal{d.h. Konfidenzintervall\hspace{0.5cm}} 
\bar{x}\pm e_n\cdot t_{n-1,1-\frac{\alpha}{2}}\\
e_n=\dfrac{S}{ \sqrt {n}} \notag
\end{empheq}
\subsubsection{Konfidenzintervall für Varianz $\sigma^2$ bzw. Standardabweichung $\sigma$}
$P(c_1\leq Q\leq c_2)=1-\alpha $\\
$Q=\frac{1}{\sigma^2}\sum\limits_{i=1}^n(X_i-\bar{X})^2 $\\
$c_1=q_{n-1,\frac{\alpha}{2}} $\hspace{1cm}$c_2=q_{n-1,1-\frac{\alpha}{2}} $\\
\begin{empheq}[box=\mycolorbox]{align}
\textnormal{d.h. Konfidenzintervall\hspace{0.5cm}} \dfrac{(n-1)\cdot S^2}{c_{1;2}}
\end{empheq}

\subsection{Schätzung einer unbekannten Wahrscheinlichkeit $p$}
$P(|U|\leq c_{1-\frac{\alpha}{2}})=1-\alpha$\\[0.5em]
\begin{empheq}[box=\mycolorbox]{align}
	U=\dfrac{\dfrac{\bar{X}-P}{\sqrt{p\cdot(1-p)}}}{\sqrt{n}}
\end{empheq}

\subsubsection{1. Näherungsweise Berechnung des Intervalls}
\begin{empheq}[box=\mycolorbox]{align}
	\textnormal{Intervall:\hspace{0.5cm}}\bar{x}\pm\frac{1}{2\sqrt{n}}\cdot c_{1-\frac{\alpha}{2}}
\end{empheq}

\subsubsection{2. Exakte Berechnung des Intervalls}
Konvention: $c=c_{1-\frac{\alpha}{2}}$\\
\begin{empheq}[box=\mycolorbox]{align}
	P_{1;2}=\dfrac{n}{n+c^2}\cdot\left(\bar{x}+\dfrac{c^2}{2n}\pm c\cdot\sqrt{\dfrac{\bar{x}\cdot(1-\bar{x})}{n}+\left(\dfrac{c}{2n}\right)^2}\right)\\
	\approx\bar{x}\pm c\cdot\sqrt{\dfrac{\bar{x}\cdot(1-\bar{x})}{n}} \textnormal{\hspace{0.5cm}(für große n)}
\end{empheq}
\section{Testverfahren}
\subsection{Verfahren zur Durchführung}
\begin{enumerate}
  \item Formulierung der Hypothese $H$ und Festlegung d. Signifikanzniveaus $\alpha$ (z.B. $\alpha=0,05$)
  \item Wahl der Testvariablen $T=f(X_1, \ldots, X_n)$ und Wahl des kritischen Bereichs $B$ mit $w=P(T\in B|H)\leq\alpha$\\Beachte hinzufügen??
  \item Berechnung der Realisierung $t=f(x_1, \ldots, x_n)$ aufgrund der konkreten Stichprobenwerte $x_1, \ldots, x_n$
  \item $H$ wird abgelehnt, falls $t\in B$
\end{enumerate}
einseitiger Test: \parbox[t]{12cm}
{\begin{enumerate}
  \item Bei vorheriger Einschränkung des Parameterbereichs auf eine Seite
  \begin{enumerate}
    \item $\mu\geq\mu_0$ ``rechtsseitiger'' Test
    \item $\mu\leq\mu_0$ ``linksseitiger'' Test
  \end{enumerate}
  \item Zusammengesetzte Hypothesen $H(\mu\geq\mu_0)$ bzw. $H(\mu\leq\mu_0)$
  \begin{enumerate}
    \item $H(\mu\geq\mu_0)$ ``linksseitiger'' Test
    \item $H(\mu\leq\mu_0)$ ``rechtsseitiger'' Test
  \end{enumerate}
\end{enumerate}}

\subsection{Testverfahren bei normalverteilten Grundgesamtheiten $(X, \Phi_{\mu,\sigma})$}
\begin{enumerate}
  \item $H(\mu=\mu_0)$, $\sigma$ bekannt\\[0.2em]
  \begin{empheq}[box=\mycolorbox]{align}
  	Z=\sqrt{n}\cdot\dfrac{\bar{X}-\mu_0}{\sigma} \textnormal{\hspace{0.5cm} Standardnormalverteilt bei Zutreffen von $H$}
  \end{empheq}
  	
	einseitiger Test: $B=\left\{z:z>c_{1-\alpha}\right\}$ oder $B=\left\{z:z<c_\alpha\right\}$\\
	zweiseitiger Test: $B=\left\{z:z>c_{1-\frac{\alpha}{2}}\right\}\cup \left\{z:z<c_{\frac{\alpha}{2}}\right\}$
  \item $H(\mu=\mu_0)$, $\sigma$ unbekannt\\[0.2em]
  \begin{empheq}[box=\mycolorbox]{align}
  	T=\sqrt{n}\cdot\dfrac{\bar{X}-\mu_0}{S}\textnormal{\hspace{0.5cm} t-Verteilt mit Parameter $n-1$ bei Zutreffen von von $H$}
  \end{empheq}
  	
  	einseitiger Test $B=\left\{t:t>t_{n-1,1-\alpha}\right\}$ oder $B=\left\{t:t<t_{n-1,\alpha}\right\}$\\
  	zweiseitiger Test $B=\left\{t:t>t_{n-1,1-\frac{\alpha}{2}}\right\}\cup\left\{t:t<t_{n-1,\frac{\alpha}{2}}\right\}$
   \item $H(\sigma=\sigma_0)$\\
   \begin{empheq}[box=\mycolorbox]{align}
   	Q=\frac{1}{(\sigma_0)^2}\sum\limits_{i=1}^n(X_i-\bar{X})^2\textnormal{\hspace{0.5cm}chiquadratverteilt mit Parameter $n-1$}
   \end{empheq}
  	
  	Quantile: \parbox[t]{8cm}{$q_{n-1,\alpha}\\ q_{n-1,1-\alpha}\\ q_{n-1,\frac{\alpha}{2}}\\\ldots$}\\
  	$Q=\dfrac{(n-1)S^2}{(\sigma)^2}$
\end{enumerate}

\subsection{Testverfahren für zwei Grundgesamtheiten}
\begin{enumerate}
  \item $H(\mu_1=\mu_2)$ zwei normalverteilte Grundgesamtheiten mit Parameter $\mu_1,\sigma_1,\mu_2,\sigma_2$\\
  	$\sigma_1,\sigma_2$ bekannt\\
  	Stichproben \parbox[t]{5cm}{$X_1,\ldots,X_m$\\
  							    $Y_1,\ldots,Y_n$}
  \begin{empheq}[box=\mycolorbox]{align}
  	Z=\dfrac{\bar{X}-\bar{Y}}{\sqrt{\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n}}}\textnormal{\hspace{0.5cm} Bei Zutreffen von $H$ standardnormalverteilt}
  \end{empheq}
  \item $H(\mu_1=\mu_2)$\\
  $\sigma_1=\sigma_2=\sigma$ unbekannt
  \begin{empheq}[box=\mycolorbox]{align}
  	T=\dfrac{\bar{X}-\bar{Y}}{\sqrt{(m-1)\cdot (S_1)^2+(n-1)\cdot (S_2)^2}}\cdot\sqrt{\dfrac{m\cdot n\cdot(m+n-2)}{m+n}}\\\textnormal{bei Zutreffen von $H$ t-verteilt mit $m+n-2$ Freiheitsgraden}\notag
  \end{empheq}
  Speziell $m=n$
  \begin{empheq}[box=\mycolorbox]{align}
  	T=\sqrt{n}\cdot\dfrac{\bar{X}-\bar{Y}}{\sqrt{(S_1)^2+(S_2)^2}}\textnormal{\hspace{0.5cm}t-verteilt mit $2n-2$ Freiheitsgraden}
  \end{empheq}
  \item $H(\sigma_1=\sigma_2)$\\
  \begin{empheq}[box=\mycolorbox]{align}
   	&W=\dfrac{Q_1}{Q_2}=\dfrac{\frac{1}{m-1}\sum\limits_{i=1}^m(X_i-\bar{X})^2}{\frac{1}{n-1}\sum\limits_{i=1}^n(Y_i-\bar{Y})^2}=\dfrac{(S_1)^2}{(S_2)^2}\\
   	&\textnormal{bei Zutreffen von $H$ F-verteilt mit Parameter $(m-1,n-1)$}\notag
  \end{empheq}
  Beachte:
  \begin{empheq}[box=\mycolorbox]{align}
  	W=\dfrac{\frac{1}{(\sigma_1)^2}Q_1}{\frac{1}{(\sigma_2)^2}Q_2}=\dfrac{Q_1}{Q_2}\textnormal{\hspace{0.5cm}bei Zutreffen der Hypothese}
  \end{empheq}
  	Quantile: $f_{m-1,n-1,1-\alpha}$ etc.
\end{enumerate}

\section{Varianzanalyse}
\begin{itemize}
  \item $k$ $(i=1,\ldots,k)$ normalverteilte Grundgesamtheiten mit Erwartungswert $\mu_i$ und Standardabweichung $\sigma$ 
  \item aus $i$-ter Grundgesamtheit wird Stichprobe vom Umfang $n_i$ entnommen
  \item aus Messwerten $x_{ij}$ wird Hypothese $H(\mu_1=\ldots=\mu_k)$ getestet\\
  $
  1:X_{11},\ldots,X_{1n_1}\\
  2:X_{21},\ldots,X_{2n_2}\\
  \ldots\\
  k:X_{k1},\ldots,X_{kn_k}
  $
\end{itemize}
Quadratsumme und Quadratsummenmittel \emph{zwischen} den Gruppen:
\begin{empheq}[box=\mycolorbox]{align}
	&\textnormal{SS1}=\sum\limits_{i=1}^kn_i(\bar{x_i}-\bar{x})^2\\
	&\textnormal{MS1}=\frac{1}{k-1}\textnormal{SS1}
\end{empheq}
Quadratsumme und Quadratsummenmittel \emph{innerhalb} der Gruppen:
\begin{empheq}[box=\mycolorbox]{align}
	&\textnormal{SS2}=\sum\limits_{i=1}^k\sum\limits_{j=1}^{n_i}(x_{ij}-\bar{x_i})^2\\
	&\textnormal{MS2}=\frac{1}{n-k}\textnormal{SS2}
\end{empheq}
Quadratsumme und Quadratsummenmittel \emph{insgesamt}:
\begin{empheq}[box=\mycolorbox]{align}
	&\textnormal{SS}=\textnormal{SS1}+\textnormal{SS2}\\
	&\textnormal{MS}=\frac{1}{n-1}\textnormal{SS}\textnormal{\hspace{0.5cm}Schätzwert für $\sigma^2$}
\end{empheq}
Die zum Test benötigten Größen sind in der folgenden Tabelle zusammengestellt\\
\begin{tabular}{|c|c c|}
\hline
$k-1$ & SS1 & MS1\\
$n-k$ & SS2 & MS2\\
\hline
$n-1$ & SS & MS\\
\hline
\end{tabular}
\begin{empheq}[box=\mycolorbox]{align}
w=\dfrac{\textnormal{MS1}}{\textnormal{MS2}}\textnormal{\hspace{0.5cm} bei Zutreffen von $H$ F-verteilt mit Parameter $(k-1,n-k)$}
\end{empheq}